Рынок заведений общественного питания Москвы.

Цель исследования:

  1. Проанализировать рынок заведений общественного питания Москвы:

1.1. Выявить особенности и закономерности

1.2. Сделать выводы и презентовать полученные результаты

  1. На основании ислледования дать рекомендации по открытию заведения общественного питания в Москве

Ход исследования :

1. Загрузка и изучение общей информации

1.1. Изучение общей информации и датасете

1.2. Изучение содержимого по столбцам

1.2.1. Количество представленных заведений

1.2.2. Количество и список уникальных значений категорий заведений

1.2.3. Изучение информации о днях и часах работы заведений

1.2.4. Изучение информации о рейтингах заведений

1.2.5. Изучение категорий цен в заведениях

1.2.6. Изучение данных столбца chain

1.2.7. Количество и список уникальных значений административных районов, в которых находятся заведения

1.2.8. Изучение данных о количестве посадочных мест в заведениях

1.3. Вывод по разделу

2. Предобработка данных

2.1. Добавление новых столбцов

2.1.1. Создание стлбца со средней стоимостью бокала пива

2.1.2. Создание столбца с названием улиц

2.1.3. Создание столбца с индикатором круглосуточности заведения

2.2. Изменение типов данных

2.3. Проверка данных на дубликаты

2.4. Проверка данных на пропуски

2.5. Заполнение и удаление пропусков

2.6. Вывод по разделу

3. Анализ данных

3.1. Изучение данных в разрезе категорий

3.2. Изучение данных в разрезе количества посадочных мест

3.3. Изучение данных в разрезе сетевых и несетевых заведений

3.3.1. Какие категории заведений чаще являются сетевыми?

3.4. Топ-15 популярных сетей в Москве

3.5. Изучение данных в разрезе административныз районов

3.6. Изучение данных в разрезе рейтингов

3.6.1. Фоновая картограмма (хороплет) со средним рейтингом заведений каждого района

3.7. Отобразить все заведения датасета на карте

3.8. Найти топ-15 улиц по количеству заведений

3.9. Найти улицы, на которых находится только один объект общепита

3.10. Как удалённость от центра влияет на цены в заведениях?

3.11. Вывод по разделу

4. Детализация исследование: открытие кофейни

4.1. Сколько всего кофеен в датасете?

4.2. В каких районах их больше всего, каковы особенности их расположения?

4.3. Есть ли круглосуточные кофейни?

4.4. Какие у кофеен рейтинги?

4.5. Как рейтинги распределяются по районам?

4.6. На какую стоимость чашки капучино стоит ориентироваться при открытии и почему?

4.7. Вывод по разделу

5. Презентация

6. Общий вывод по исследованию

Загрузка и изучение общей информации

К содержанию

Импорт будлиотек, настроек и функций

Изучение общей информации и датасете

К содержанию

Изучение содержимого по столбцам

К содержанию

Количество представленных заведений

К содержанию

Количество и список уникальных значений категорий заведений

К содержанию

Изучение информации о днях и часах работы заведений

К содержанию

Изучение информации о рейтингах заведений

К содержанию

Изучение категорий цен в заведениях

К содержанию

Изучение данных столбца chain

К содержанию

Количество и список уникальных значений административных районов, в которых находятся заведения

К содержанию

Изучение данных о количестве посадочных мест в заведениях

К содержанию

Вывод по разделу

К содержанию

В таблице данные о 8406 заведениях, из которых 5614 уникальных, вероятно остальные заведения сетевые.

Есть пропуски в столбцах hours, priceб avg_bill, middle_avg_bill, middle_coffee_cup и seats.

Полные дубликаты отсутствуют.

Есть 8 категорий заведений(в порядке убывания количества заведений): "кафе", "ресторан", "кофейня", "бар,паб","пиццерия","быстрое питание","столовая" и "булочная".

Существует 1307 разных режимов работы, наиболее популярные (в порядке убывания количества заведений): "ежедневно, 10:00–22:00", "ежедневно, круглосуточно", "ежедневно, 11:00–23:00", "ежедневно, 10:00–23:00", "ежедневно, 12:00–00:00".

Наиболее распространенные рейтинги заведений от 4,1 до 4,5.

Представлены 4 категории цен (в порядке убывания количества заведений): "средние", "выше среднего", "высокие", "низкие".

Есть 5201 несетевое заведение и 3205 сетевое.

Представлены данные по 9 административным округам, больше всего заведений располагается в Центральном, меньше всего в Северо-Западном.

Количество посадочных мест варьируется от 0 до 1288, медианное значение - 75, большая часть заведений вмещает не более 200 человек.

Предобработка данных

К содержанию

Добавление новых столбцов

К содержанию

Создание столбца со средней стоимостью бокала пива для категории "бар, паб"

К содержанию

avg_bill содержит строки начинающиеся только с вышеперечисленных подстрок, можно добавить столбец со средней стоимостью бокала пива

Создание столбца "street" с названиями улиц из адресов заведений

К содержанию

не вышло вывести улицы только для 27 заведений

Создание столбца "is_24_7", с обозначением, что заведение работает ежедневно и круглосуточно (24/7)

К содержанию

Изменение типов данных

К содержанию

Приведение столбца "chain" к булевым значениям

К содержанию

Приведение столбца "middle_avg_bill" к числовым значениям

К содержанию

Проверка данных на дубликаты

К содержанию

Проверка на полные дубликаты выполнена в первом разделе, но возможно какието заведения попали с таблицу несколько раз, например с разными рейтингами или категориями, чтобы это проверить выполнена проверка на дубликаты по паре "название заведения" + "адрес". Дубликатов не обнаружено, значит каждое заведение действительно попало в таблицу только один раз.

Явных дубликатов в таблице нет, однако есть часто повтряющиеся названия, причем некоторые из заведений с одинаковыми названиями сетевые, а некоторые нет, так же есть похожие названия которые возможно принадлежат к одной сети (например сеть surf coffee представлена в датафрейме как несетевые кофейни с разными названиями). Поэтому качественно очистить данные от неявных дубликатов невозможно. Если бы в данных присутвовали уникальные идентификаторы сетей и заведений, можно было бы воспользоваться ими, например можно добавить столбец с ИНН организации, тогда можно было бы группировать данные по нему, наиболее точно выбрать сетевые и несетевые заведения и качественно избавиться от неявных дубликатов в названиях.

Проверка данных на пропуски

К содержанию

Есть 536 пропусков в часах работы, их не получится заполнить.

5091 пропуск в категории цен, если для этих строк есть значения диапозона среднего чека (avg_bill), их можно будет заполнить, задав категории цен для каждой категории заведения.

4590 пропусков в значениях диапозона среднего чека можно заполнить, если для этих строк есть категория цен.

5257 пропусков в middle_avg_bill можно заполнить если значение диапозона среднего чека начинается с подстроки "Средний счёт:"

7871 пропуск в middle_coffee_cup можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена чашки капучино"

8274 пропуска в middle_pint можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена бокала пива"

3611 пропусков в количестве посадочных мест заполнить не получится, однако стоит проверить, для каких категорий заведений отсутствуют эти данные.

27 пропусков в street не получится заполнить.

Заполнение и удаление пропусков

К содержанию

Посмотрим какие катеории заведений соответствуют среднему чеку, средней стоимости чашки кофе и средней стоимости бокала пива.

К содержанию

Средний чек может присутствовать во всех категориях.

Средняя чена чашки кофе будет присутствовать в категориях 'кофейня', 'кафе', 'пиццерия', 'бар,паб', 'быстрое питание'.

Средняя цена бокала пива есть только в категориях 'бар,паб' и 'пиццерия'.

Проверим, есть ли строки, для которых посчитано больше одной из средних

К содержанию

Для каждой строки есть только что-то одно, либо средний чек, либо средняя цена чашки кофе, либо средняя цена бокала пива.

Проверим, есть ли строки, в которых есть значение avg_bill но нет значений в middle_avg_bill, middle_avg_bill и middle_pint

К содержанию

Нет таких строк где есть диапазон цен, но нет среднего чека, цены чашки кофе или цены бокала пива.

Заполним пропуски в middle_avg_bill, middle_coffee_cup и middle_pint нулями и выведем колонку 'avg' в которой будет отображаться средий счет для каждого заведения.

Заполним пропуски в категориях цен.

К содержанию

Есть 743 строки, где есть диапазон цен, но нет категории для них.

Каким образом заполнялись категории непонятно, например для категории кафе максимальная цена в категории средние - 1750, а в категории выше среднего - 1700. Лучше будет перезаполнить категории самостоятельно.

Вывод по разделу

К содержанию

Было создано 4 новых столбца: "midle_pint" со средней стоимостью бокала пива, "street" с названием улицы, где находится заведение, "is_24_7" со значениями true-заведение является круглосуточным, false-заведение не является круглосуточным, и "avg" - единый столбец со средним чеком заведения (содержит средний чек, стоимость чашки кофе или стоимость бокала пива, в зависимости от того какие данные были в исходном файле).

Данные были приведены к оптимальным типам переменных

Данные были проверены на явные дубликаты и на дубликаты по паре значений название+адрес. Явных дубликатов в таблице нет, однако есть часто повтряющиеся названия, причем некоторые из заведений с одинаковыми названиями сетевые, а некоторые нет, так же есть похожие названия которые возможно принадлежат к одной сети (например сеть surf coffee представлена в датафрейме как несетевые кофейни с разными названиями). Поэтому качественно очистить данные от неявных дубликатов невозможно. Если бы в данных присутвовали уникальные идентификаторы сетей и заведений, можно было бы воспользоваться ими, например можно добавить столбец с ИНН организации, тогда можно было бы группировать данные по нему, наиболее точно выбрать сетевые и несетевые заведения и качественно избавиться от неявных дубликатов в названиях.

Есть 536 пропусков в часах работы, их не получится заполнить.

5091 пропуск в категории цен, если для этих строк есть значения диапозона среднего чека (avg_bill), их можно будет заполнить, задав категории цен для каждой категории заведения.

4590 пропусков в значениях диапозона среднего чека можно заполнить, если для этих строк есть категория цен.

5257 пропусков в middle_avg_bill можно заполнить если значение диапозона среднего чека начинается с подстроки "Средний счёт:"

7871 пропуск в middle_coffee_cup можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена чашки капучино"

8274 пропуска в middle_pint можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена бокала пива"

3611 пропусков в количестве посадочных мест заполнить не получится, однако стоит проверить, для каких категорий заведений отсутствуют эти данные.

27 пропусков в street не получится заполнить.

Были выбраны границы ценовых диапазонов для каждой категории и перезаполнены категории цен.

Анализ данных

К содержанию

Изучение данных в разрезе категорий

К содержанию

Какие категории заведений представлены в данных? Исследуйте количество объектов общественного питания по категориям: рестораны, кофейни, пиццерии, бары и так далее. Постройте визуализации. Ответьте на вопрос о распределении заведений по категориям.

В таблице представлены 8 категорий заведений : "кафе", "ресторан", "кофейня", "бар,паб","пиццерия","быстрое питание","столовая" и "булочная". Кафе и рестораны составляют больше половины всех заведений Москвы. Четверть занимают кофейни и бары, и еще четверть приходитсяна пиццерии, заведения быстрого питания, столовые и булочные.

Изучение данных в разрезе количества посадочных мест

К содержанию

Исследуйте количество посадочных мест в местах по категориям: рестораны, кофейни, пиццерии, бары и так далее. Постройте визуализации. Проанализируйте результаты и сделайте выводы.

Сколько всего человек могут одновременно вместить заведения Москвы?

К содержанию

Заведения Москвы с указанным количеством мест (около трети этих данных пропущено) могут одновременно вместить более полумиллиона человек, это около 4% от населения Москвы на 2022 год. При этом больше половины посадочных мест находятся в кафе и ресторанах. Выпить в барах и пабах Москвы могут одновременно 58 тысяч человек, а поужинать в ресторанах почти 155 тысяч.

Посмотрим на распределение заведений по количеству посадочных мест

К содержанию

Выше отметки в 400 мест видны единичные случаи, будем считать их выбросами и построим гистограмму с ограничением посадочных мест до 400.

Пик количества посадочных мест приходится на 40-60.

Медианное количество мест по категориям.

К содержанию

Самыми вместительными оказались рестораны, бары и кофейни (окло 80 мест в заведении), меньше всего людей вмещают булочные и пиццерии (около 50)

Есть ли разница в количестве посадочных мест для сетевых и несетевых заведений?

К содержанию

В несетевых барах и пиццериях медианное количество мест немного больше, а в остальных 6 категориях сетевые заведения более вместительны, особенно это касается кофеен и заведений быстрого питания.

Есть ли разница в количестве посадочных мест для круглосуточных и некруглосуточных заведений?

К содержанию

В круглосуточных барах и булочных медианное количество мест немного больше, в кофейнях разницы почти нет, а в остальных 5категориях некруглосуточные заведения более вместительны, особенно это касается столовых и заведений быстрого питания.

Изучение данных в разрезе сетевых и несетевых заведений

К содержанию

Рассмотрите и изобразите соотношение сетевых и несетевых заведений в датасете. Каких заведений больше? Какие категории заведений чаще являются сетевыми? Исследуйте данные и ответьте на вопрос графиком.

Несетевых заведений на 2000 больше чем несетевых. В процентном соотношении cетевые заведения составляют 38.1% а несетевые 61.9%.

Какие категории заведений чаще являются сетевыми?

К содержанию

Сетевые булочные, кофейни и пиццерии встречаются немного чаше чем несетевые. Несетевых кафе, ресторанов и баров гораздо больше чем стевых

Топ-15 популярных сетей в Москве

К содержанию

Сгруппируйте данные по названиям заведений и найдите топ-15 популярных сетей в Москве. Под популярностью понимается количество заведений этой сети в регионе. Постройте подходящую для такой информации визуализацию. Знакомы ли вам эти сети? Есть ли какой-то признак, который их объединяет? К какой категории заведений они относятся?

Заполним неизвестные категории цен

Более трети самых популярных сетевых заведений занимают кофейни. Самая популярная сеть кофеен "Шоколадница" насчитывает 119 заведений в Москве, далее две пицерии Доминос(76) и До-до(74).

Если считать заведения, а не категории, то кофейни составляют уже 45,6%, рестораны 20,1%, а пиццерии 19,5%.

Рассмотрим медианное количество посадочных мест в заведениях топ-15 сетей.

К содержанию

В среднем в заведениях топ-15 сетей около 60 мест, меньше всего в До-до (40), больше всего в Кофемании(120

Расмотрим медианные рейтинги

К содержанию

Медианные рейтинги от 4,0 до 4,4. Ниже всего у Яндекс лавки и Сofefest, самые высокие у Братьев Караваевых, Буханки и Кофемании.

Расмотрим ценовые категории

К содержанию

Если ценовая категория известна, в 51% случаев она относится к низким, в 34 к средним, и в 3% к категории выше среднего

Изучение данных в разрезе административныз районов

К содержанию

Какие административные районы Москвы присутствуют в датасете? Отобразите общее количество заведений и количество заведений каждой категории по районам. Попробуйте проиллюстрировать эту информацию одним графиком.

В таблице представлено 9 административных районов Москвы:Центральный, Северный, Южный, Северо-Восточный, Западный, Восточный, Юго-Восточный, Юго-Западный, Северо-Западный.

В центральном округе заведений больше всего, меньше всего в Северо-Западном.

Во всех округах кроме Центрального самая обширная категория заведений - кафе, в Центральном самая популярная категория - ресторан, далее кафе, кофейни и бары. Кофейни обычно третья по численности группа (исключение - Северный АО, там кофейни на втором месте). Самые редкие заведения во всех районах - столовые и булочные.

В центральном округе на 1000 человек приходится 2,88 заведений и 184.47 посадочных мест, наблюдается высокая концентрация заведений при низкой численности населения. Большое количество заведений объясняется тем, что центральный округ является местом досуга для многих москвичей. Далее идут Северный, Северо-Восточный и Западный АО, там на 1000 человек приходися от 0,61 до 0,76 заведений и от 34 до 53 посадочных мест.

Самое низкое количество заведений на 1000 человек наблюдается в Северо-западном округе (0,4 заведения на 1000 чел), при этом количество посадочных мест там не минимальное, значит в том округе есть несколько крупных заведений. Далее идут Юго-Западный, Юго_восточный и Южный АО, там на 1000 человек приходится 0,5 заведения и от 20 до 35 посадочных мест. Скорее всего это связано с высокой плотностью населения в этих АО.

Распределение заведений по Москве непропорционально плотности населения, вероятно оно связано с уровнем дохода населения, транспортной доступностью, наличием пешеходных улиц, парков, развлекательных и торговых центров, достопримечательностей и других мест досуга.

Изучение данных в разрезе рейтингов

К содержанию

Визуализируйте распределение средних рейтингов по категориям заведений. Сильно ли различаются усреднённые рейтинги в разных типах общепита?

Самые высокие рейтинги у баров и пабов, медианное значение почти 4,4, а самые низкие у заведений быстрого питания примерно 4,05. При этом у сетевых ресторанов и кофеен рейтинги примерно на 0,1 балла меньше чем у несетевых, а с кафе ситуация обратная: сетевые заведения выигрывают на 0,1 балла по сравнению с несетевыми.

Постройте фоновую картограмму (хороплет) со средним рейтингом заведений каждого района

К содержанию

Самые высокие рейтинги в центральном, северном и северо-западном округах, самые низкие в юго-восточном.

Отобразите все заведения датасета на карте

К содержанию

Большая часть заведений сосредоточена в центре.

Найдите топ-15 улиц по количеству заведений

К содержанию

Найдите топ-15 улиц по количеству заведений. Постройте график распределения количества заведений и их категорий по этим улицам. Попробуйте проиллюстрировать эту информацию одним графиком.

Самое большое количество заведение на Проспекте мира, далее Профсоюзная улица, проспект Вернадского, Ленинский проспект, Ленинградский проспект и Дмитровское шосее.

Все улицы попавшие в топ-15 довольно протяженные, частично большон количество заведений объясняется этим.

на этих улицах довольно много крупных заведений, около 25 заведений с числом посадочных мест от 600 до 650, и около 15 заведений с числом посадочных мест от 1200.

Найдите улицы, на которых находится только один объект общепита

К содержанию

Найдите улицы, на которых находится только один объект общепита. Что можно сказать об этих заведениях?

Есть 467 улиц, на которых располагается только одно заведение, три четверти от них это кафе, рестораны и кофейни. Это небольшие заведения в них не более 250 мест, в среднем 50. Рейтинги распределены примерно так же как и по Москве в целом. В основном это несетевые заведения, почти все некруглосуточные.

Как удалённость от центра влияет на цены в заведениях?

К содержанию

Самые дорогие заведения располагаются в центральном, западном, северо-западном и северном округах. Самые дешевые в юго-восточном

Вывод по разделу

К содержанию

В таблице представлены 8 категорий заведений : "кафе", "ресторан", "кофейня", "бар,паб","пиццерия","быстрое питание","столовая" и "булочная". Кафе и рестораны составляют больше половины всех заведений Москвы. Четверть занимают кофейни и бары, и еще четверть приходитсяна пиццерии, заведения быстрого питания, столовые и булочные. Для визуализации использована интерактивная круговая диаграмма, так как она позволяет наглядно показать доли от общего количества и абсолютное количество заведений.

Заведения Москвы с указанным количеством мест (около трети этих данных пропущено) могут одновременно вместить более полумиллиона человек, это около 4% от населения Москвы на 2022 год. При этом больше половины посадочных мест находятся в кафе и ресторанах. Выпить в барах и пабах Москвы могут одновременно 58 тысяч человек, а поужинать в ресторанах почти 155 тысяч.

Пик количества посадочных мест приходится на 40-60.

Самыми вместительными оказались рестораны, бары и кофейни (окло 80 мест в заведении), меньше всего людей вмещают булочные и пиццерии (около 50)

В несетевых барах и пиццериях медианное количество мест немного больше, а в остальных 6 категориях сетевые заведения более вместительны, особенно это касается кофеен и заведений быстрого питания.

В круглосуточных барах и булочных медианное количество мест немного больше, в кофейнях разницы почти нет, а в остальных 5 категориях некруглосуточные заведения более вместительны, особенно это касается столовых и заведений быстрого питания.

Несетевых заведений на 2000 больше чем несетевых. В процентном соотношении cетевые заведения составляют 38.1% а несетевые 61.9%.

Сетевые булочные, кофейни и пиццерии встречаются немного чаше чем несетевые. Несетевых кафе, ресторанов и баров гораздо больше чем стевых

Более трети самых популярных сетевых заведений занимают кофейни. Самая популярная сеть кофеен "Шоколадница" насчитывает 119 заведений в Москве, далее две пицерии Доминос(76) и До-до(74).

Если считать заведения, а не категории, то кофейни составляют уже 45,6%, рестораны 20,1%, а пиццерии 19,5%.

В среднем в заведениях топ-15 сетей около 60 мест, меньше всего в До-до (40), больше всего в Кофемании(120)

Медианные рейтинги от 4,0 до 4,4. Ниже всего у Яндекс лавки и Сofefest, самые высокие у Братьев Караваевых, Буханки и Кофемании.

Если ценовая категория известна, в 53% случаев она относится к низким, в 27 к средним, и в 7% к категории выше среднего

В таблице представлено 9 административных районов Москвы:Центральный, Северный, Южный, Северо-Восточный, Западный, Восточный, Юго-Восточный, Юго-Западный, Северо-Западный.

В центральном округе заведений больше всего, меньше всего в Северо-Западном.

Во всех округах кроме Центрального самая обширная категория заведений - кафе, в Центральном самая популярная категория - ресторан, далее кафе, кофейни и бары. Кофейни обычно третья по численности группа (исключение - Северный АО, там кофейни на втором месте). Самые редкие заведения во всех районах - столовые и булочные.

В центральном округе на 1000 человек приходится 2,88 заведений и 184.47 посадочных мест, наблюдается высокая концентрация заведений при низкой численности населения. Большое количество заведений объясняется тем, что центральный округ является местом досуга для многих москвичей. Далее идут Северный, Северо-Восточный и Западный АО, там на 1000 человек приходися от 0,61 до 0,76 заведений и от 34 до 53 посадочных мест.

Самое низкое количество заведений на 1000 человек наблюдается в Северо-западном округе (0,4 заведения на 1000 чел), при этом количество посадочных мест там не минимальное, значит в том округе есть несколько крупных заведений. Далее идут Юго-Западный, Юго_восточный и Южный АО, там на 1000 человек приходится 0,5 заведения и от 20 до 35 посадочных мест. Скорее всего это связано с высокой плотностью населения в этих АО.

Распределение заведений по Москве непропорционально плотности населения, вероятно оно связано с уровнем дохода населения, транспортной доступностью, наличием пешеходных улиц, парков, развлекательных и торговых центров, достопримечательностей и других мест досуга.

Самые высокие рейтинги у баров и пабов, медианное значение почти 4,4, а самые низкие у заведений быстрого питания примерно 4,05. При этом у сетевых ресторанов и кофеен рейтинги примерно на 0,1 балла меньше чем у несетевых, а с кафе ситуация обратная: сетевые заведения выигрывают на 0,1 балла по сравнению с несетевыми.

Самые высокие рейтинги в центральном, северном и северо-западном округах, самые низкие в юго-восточном.

Большая часть заведений сосредоточена в центре.

Самое большое количество заведение на Проспекте мира, далее Профсоюзная улица, проспект Вернадского, Ленинский проспект, Ленинградский проспект и Дмитровское шосее.

Все улицы попавшие в топ-15 довольно протяженные, частично большон количество заведений объясняется этим.

на этих улицах довольно много крупных заведений, около 25 заведений с числом посадочных мест от 600 до 650, и около 15 заведений с числом посадочных мест от 1200.

Есть 467 улиц, на которых располагается только одно заведение, три четверти от них это кафе, рестораны и кофейни. Это небольшие заведения в них не более 250 мест, в среднем 50. Рейтинги распределены примерно так же как и по Москве в целом. В основном это несетевые заведения, почти все некруглосуточные.

Самые дорогие заведения располагаются в центральном, западном, северо-западном и северном округах. Самые дешевые в юго-восточном

Детализация исследование: открытие кофейни

К содержанию

Сколько всего кофеен в датасете?

К содержанию

Всего по данным датафрейма в Москве 1413 кофеен

В каких районах их больше всего, каковы особенности их расположения?

К содержанию

Больше всего кофеен в центральном округе (30,3% от общего количества), на втором месте по числу кофеен северный округ (13,7%), на третьем северо-восточный (11,3%). Меньше всего кофеен расположено в юго-восточном и северо-западном округах.

Самые дорогие заведения находятся в центре и на западе Москвы, самые дешевые на юго-западе и юго-востоке.

Есть ли круглосуточные кофейни?

К содержанию

Есть 59 круглосуточных кофеен, почти половина расположена в центральном округе, и всего по одной в юго-восточном и южном округах. Сетевых круглосуточных кофеен зачительно больше чем несетевых, 50 против 9. Больше всего круглосуточных кофеен принадлежит к сети "шоколадница" их 17, есть 12 круглосуточных кофеен "wild bean" и 8 кофеен сети "кофемания".

Какие у кофеен рейтинги?

К содержанию

Средний рейтинг кофеен 4.3, средний рейтинг несетевых кофеен выше чем у сетевых. Есть 37 кофеен с максимальным рейтингом, из них 30 сетевых, и всего 1 круглосуточная.

Как рейтинги распределяются по районам?

К содержанию

Самые высокие рейинги в Центральном и Северо-Западном АО, далее Северный и Юго-Западный. Самые низкие рейтиги в Западном АО.

Сколько в среднем посадочных мест в в кофейнях?

Есть две кофейни с числом посадочных мест более 1200, но в основном мест в кофейнях от 40 до 140, медианное значение 80.

На графике пик числа посадочных мест приходится на промежуток 25-50 мест

На какую стоимость чашки капучино стоит ориентироваться при открытии и почему?

К содержанию

Средняя и медианная цены чашки каппучино после удаления выброса и нулевых значений почти равны, около 170 рублей, в целом можно ориентироваться на цену ниже этого значения, однако ориентировочная цена чашки каппучино зависит от формата заедения.

С повышением цены немного увеличивается рейтинг, а вот от количества посадочных мест средняя ена не зависит.

У стевых кофеен распространены цены примерно в 60, 100 и 250 рублей. В несетевых цены в основном от 100 до 300 рублей.

Вывод по разделу

К содержанию

Всего по данным датафрейма в Москве 1413 кофеен

Больше всего кофеен в центральном округе (30,3% от общего количества), на втором месте по числу кофеен северный округ (13,7%), на третьем северо-восточный (11,3%). Меньше всего кофеен расположено в юго-восточном и северо-западном округах.

Самые дорогие заведения располагаются в центральном, западном, северо-западном и северном округах. Самые дешевые в юго-восточном.

Есть 59 круглосуточных кофеен, почти половина расположена в центральном округе, и всего по одной в юго-восточном и южном округах. Сетевых круглосуточных кофеен зачительно больше чем несетевых, 50 против 9. Больше всего круглосуточных кофеен принадлежит к сети "шоколадница" их 17, есть 12 круглосуточных кофеен "wild bean" и 8 кофеен сети "кофемания".

Средний рейтинг кофеен 4.3, средний рейтинг несетевых кофеен выше чем у сетевых. Есть 37 кофеен с максимальным рейтингом, из них 30 сетевых, и всего 1 круглосуточная.

Самые высокие рейинги в Центральном и Северо-Западном АО, далее Северный и Юго-Западный. Самые низкие рейтиги в Западном АО.

Средняя и медианная цены чашки каппучино после удаления выброса и нулевых значений почти равны, около 170 рублей, в целом можно ориентироваться на цену ниже этого значения, однако ориентировочная цена чашки каппучино зависит от формата заедения.

С повышением цены немного увеличивается рейтинг, а вот от количества посадочных мест средняя цена не зависит.

Есть две кофейни с числом посадочных мест более 1200, но в основном мест в кофейнях от 40 до 140, медианное значение 80.

На графике пик числа посадочных мест приходится на промежуток 25-50 мест

У сетевых кофеен распространены цены примерно в 60, 100 и 250 рублей. В несетевых цены в основном от 100 до 300 рублей.

В центральном округе очень много кофеен, новое заведение столкнется с большой конкуренцией. Наиболее перспективны для нового заведения будут места вблизи университетов, бизнес-центров, мест отдыха и досуга, в пешей доступности от метро во всех округах кроме центрального, но на небольшом удалении от него. Для юго-востока и юго-запада Москвы подойдет заведение с низкими ценами до 150р, для остальных цены могут быть средними 150-200. Так как многие выбирают заведения по по рейтингам, необходимо стремиться к рейтингу выше 4,7. В Северо-Западном, Северном и Юго-Западном округах средние рейтинги кофеен достаточно высокие, с ними будет сложно конкурировать, а вот в Западном округе средний рейтинг минимальный по Москве.

Презентация

К содержанию

Презентация: https://disk.yandex.ru/i/NWHODnOglN5mhQ

Общий вывод по исследованию

К содержанию

В таблице данные о 8406 заведениях, из которых 5614 уникальных, вероятно остальные заведения сетевые.

Есть пропуски в столбцах hours, priceб avg_bill, middle_avg_bill, middle_coffee_cup и seats.

Полные дубликаты отсутствуют.

Есть 8 категорий заведений(в порядке убывания количества заведений): "кафе", "ресторан", "кофейня", "бар,паб","пиццерия","быстрое питание","столовая" и "булочная".

Существует 1307 разных режимов работы, наиболее популярные (в порядке убывания количества заведений): "ежедневно, 10:00–22:00", "ежедневно, круглосуточно", "ежедневно, 11:00–23:00", "ежедневно, 10:00–23:00", "ежедневно, 12:00–00:00".

Наиболее распространенные рейтинги заведений от 4,1 до 4,5.

Представлены 4 категории цен (в порядке убывания количества заведений): "средние", "выше среднего", "высокие", "низкие".

Есть 5201 несетевое заведение и 3205 сетевое.

Представлены данные по 9 административным округам, больше всего заведений располагается в Центральном, меньше всего в Северо-Западном.

Количество посадочных мест варьируется от 0 до 1288, медианное значение - 75, большая часть заведений вмещает не более 200 человек.

Было создано 4 новых столбца: "midle_pint" со средней стоимостью бокала пива, "street" с названием улицы, где находится заведение, "is_24_7" со значениями true-заведение является круглосуточным, false-заведение не является круглосуточным, и "avg" - единый столбец со средним чеком заведения (содержит средний чек, стоимость чашки кофе или стоимость бокала пива, в зависимости от того какие данные были в исходном файле).

Данные были приведены к оптимальным типам переменных

Данные были проверены на явные дубликаты и на дубликаты по паре значений название+адрес. Явных дубликатов в таблице нет, однако есть часто повтряющиеся названия, причем некоторые из заведений с одинаковыми названиями сетевые, а некоторые нет, так же есть похожие названия которые возможно принадлежат к одной сети (например сеть surf coffee представлена в датафрейме как несетевые кофейни с разными названиями). Поэтому качественно очистить данные от неявных дубликатов невозможно. Если бы в данных присутвовали уникальные идентификаторы сетей и заведений, можно было бы воспользоваться ими, например можно добавить столбец с ИНН организации, тогда можно было бы группировать данные по нему, наиболее точно выбрать сетевые и несетевые заведения и качественно избавиться от неявных дубликатов в названиях.

Есть 536 пропусков в часах работы, их не получится заполнить.

5091 пропуск в категории цен, если для этих строк есть значения диапозона среднего чека (avg_bill), их можно будет заполнить, задав категории цен для каждой категории заведения.

4590 пропусков в значениях диапозона среднего чека можно заполнить, если для этих строк есть категория цен.

5257 пропусков в middle_avg_bill можно заполнить если значение диапозона среднего чека начинается с подстроки "Средний счёт:"

7871 пропуск в middle_coffee_cup можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена чашки капучино"

8274 пропуска в middle_pint можно заполнить если значение диапозона среднего чека начинается с подстроки "Цена бокала пива"

3611 пропусков в количестве посадочных мест заполнить не получится, однако стоит проверить, для каких категорий заведений отсутствуют эти данные.

27 пропусков в street не получится заполнить.

Были выбраны границы ценовых диапазонов для каждой категории и перезаполнены категории цен.

В таблице представлены 8 категорий заведений : "кафе", "ресторан", "кофейня", "бар,паб","пиццерия","быстрое питание","столовая" и "булочная". Кафе и рестораны составляют больше половины всех заведений Москвы. Четверть занимают кофейни и бары, и еще четверть приходитсяна пиццерии, заведения быстрого питания, столовые и булочные. Для визуализации использована интерактивная круговая диаграмма, так как она позволяет наглядно показать доли от общего количества и абсолютное количество заведений.

Заведения Москвы с указанным количеством мест (около трети этих данных пропущено) могут одновременно вместить более полумиллиона человек, это около 4% от населения Москвы на 2022 год. При этом больше половины посадочных мест находятся в кафе и ресторанах. Выпить в барах и пабах Москвы могут одновременно 58 тысяч человек, а поужинать в ресторанах почти 155 тысяч.

Пик количества посадочных мест приходится на 40-60.

Самыми вместительными оказались рестораны, бары и кофейни (окло 80 мест в заведении), меньше всего людей вмещают булочные и пиццерии (около 50)

В несетевых барах и пиццериях медианное количество мест немного больше, а в остальных 6 категориях сетевые заведения более вместительны, особенно это касается кофеен и заведений быстрого питания.

В круглосуточных барах и булочных медианное количество мест немного больше, в кофейнях разницы почти нет, а в остальных 5 категориях некруглосуточные заведения более вместительны, особенно это касается столовых и заведений быстрого питания.

Несетевых заведений на 2000 больше чем несетевых. В процентном соотношении cетевые заведения составляют 38.1% а несетевые 61.9%.

Сетевые булочные, кофейни и пиццерии встречаются немного чаше чем несетевые. Несетевых кафе, ресторанов и баров гораздо больше чем стевых

Более трети самых популярных сетевых заведений занимают кофейни. Самая популярная сеть кофеен "Шоколадница" насчитывает 119 заведений в Москве, далее две пицерии Доминос(76) и До-до(74).

Если считать заведения, а не категории, то кофейни составляют уже 45,6%, рестораны 20,1%, а пиццерии 19,5%.

В среднем в заведениях топ-15 сетей около 60 мест, меньше всего в До-до (40), больше всего в Кофемании(120)

Медианные рейтинги от 4,0 до 4,4. Ниже всего у Яндекс лавки и Сofefest, самые высокие у Братьев Караваевых, Буханки и Кофемании.

Если ценовая категория известна, в 53% случаев она относится к низким, в 27 к средним, и в 7% к категории выше среднего

В таблице представлено 9 административных районов Москвы:Центральный, Северный, Южный, Северо-Восточный, Западный, Восточный, Юго-Восточный, Юго-Западный, Северо-Западный.

В центральном округе заведений больше всего, меньше всего в Северо-Западном.

Во всех округах кроме Центрального самая обширная категория заведений - кафе, в Центральном самая популярная категория - ресторан, далее кафе, кофейни и бары. Кофейни обычно третья по численности группа (исключение - Северный АО, там кофейни на втором месте). Самые редкие заведения во всех районах - столовые и булочные.

В центральном округе на 1000 человек приходится 2,88 заведений и 184.47 посадочных мест, наблюдается высокая концентрация заведений при низкой численности населения. Большое количество заведений объясняется тем, что центральный округ является местом досуга для многих москвичей. Далее идут Северный, Северо-Восточный и Западный АО, там на 1000 человек приходися от 0,61 до 0,76 заведений и от 34 до 53 посадочных мест.

Самое низкое количество заведений на 1000 человек наблюдается в Северо-западном округе (0,4 заведения на 1000 чел), при этом количество посадочных мест там не минимальное, значит в том округе есть несколько крупных заведений. Далее идут Юго-Западный, Юго_восточный и Южный АО, там на 1000 человек приходится 0,5 заведения и от 20 до 35 посадочных мест. Скорее всего это связано с высокой плотностью населения в этих АО.

Распределение заведений по Москве непропорционально плотности населения, вероятно оно связано с уровнем дохода населения, транспортной доступностью, наличием пешеходных улиц, парков, развлекательных и торговых центров, достопримечательностей и других мест досуга.

Самые высокие рейтинги у баров и пабов, медианное значение почти 4,4, а самые низкие у заведений быстрого питания примерно 4,05. При этом у сетевых ресторанов и кофеен рейтинги примерно на 0,1 балла меньше чем у несетевых, а с кафе ситуация обратная: сетевые заведения выигрывают на 0,1 балла по сравнению с несетевыми.

Самые высокие рейтинги в центральном, северном и северо-западном округах, самые низкие в юго-восточном.

Самое большое количество заведение на Проспекте мира, далее Профсоюзная улица, проспект Вернадского, Ленинский проспект, Ленинградский проспект и Дмитровское шосее.

Все улицы попавшие в топ-15 довольно протяженные, частично большон количество заведений объясняется этим.

На этих улицах довольно много крупных заведений, около 25 заведений с числом посадочных мест от 600 до 650, и около 15 заведений с числом посадочных мест от 1200.

Есть 467 улиц, на которых располагается только одно заведение, три четверти от них это кафе, рестораны и кофейни. Это небольшие заведения в них не более 250 мест, в среднем 50. Рейтинги распределены примерно так же как и по Москве в целом. В основном это несетевые заведения, почти все некруглосуточные.

Самые дорогие заведения располагаются в центральном, западном, северо-западном и северном округах. Самые дешевые в юго-восточном

Всего по данным датафрейма в Москве 1413 кофеен

Больше всего кофеен в центральном округе (30,3% от общего количества), на втором месте по числу кофеен северный округ (13,7%), на третьем северо-восточный (11,3%). Меньше всего кофеен расположено в юго-восточном и северо-западном округах.

Самые дорогие заведения располагаются в центральном, западном, северо-западном и северном округах. Самые дешевые в юго-восточном.

Есть 59 круглосуточных кофеен, почти половина расположена в центральном округе, и всего по одной в юго-восточном и южном округах. Сетевых круглосуточных кофеен зачительно больше чем несетевых, 50 против 9. Больше всего круглосуточных кофеен принадлежит к сети "шоколадница" их 17, есть 12 круглосуточных кофеен "wild bean" и 8 кофеен сети "кофемания".

Средний рейтинг кофеен 4.3, средний рейтинг несетевых кофеен выше чем у сетевых. Есть 37 кофеен с максимальным рейтингом, из них 30 сетевых, и всего 1 круглосуточная.

Самые высокие рейинги в Центральном и Северо-Западном АО, далее Северный и Юго-Западный. Самые низкие рейтиги в Западном АО.

Средняя и медианная цены чашки каппучино после удаления выброса и нулевых значений почти равны, около 170 рублей, в целом можно ориентироваться на цену ниже этого значения, однако ориентировочная цена чашки каппучино зависит от формата заедения.

С повышением цены немного увеличивается рейтинг, а вот от количества посадочных мест средняя цена не зависит.

Есть две кофейни с числом посадочных мест более 1200, но в основном мест в кофейнях от 40 до 140, медианное значение 80.

На графике пик числа посадочных мест приходится на промежуток 25-50 мест

У сетевых кофеен распространены цены примерно в 60, 100 и 250 рублей. В несетевых цены в основном от 100 до 300 рублей.

В центральном округе очень много кофеен, новое заведение столкнется с большой конкуренцией. Наиболее перспективны для нового заведения будут места вблизи университетов, бизнес-центров, мест отдыха и досуга, в пешей доступности от метро во всех округах кроме центрального, но на небольшом удалении от него. Для юго-востока и юго-запада Москвы подойдет заведение с низкими ценами до 150р, для остальных цены могут быть средними 150-200. Так как многие выбирают заведения по по рейтингам, необходимо стремиться к рейтингу выше 4,7. В Северо-Западном, Северном и Юго-Западном округах средние рейтинги кофеен достаточно высокие, с ними будет сложно конкурировать, а вот в Западном округе средний рейтинг минимальный по Москве.